🎯 Model Prediksi Churn Pelanggan Telekomunikasi

Solusi Kecerdasan Buatan untuk Mengidentifikasi dan Mencegah Pelanggan yang Berhenti Berlangganan dengan Akurasi 80.33%

80.33% ⭐
Akurasi Model
90.08% 🎯
Tingkat Deteksi
84.11% ✅
Presisi Prediksi
186,567% 💰
Potensi ROI
3.2 hari ⏱️
Masa Balik Modal

📈 Ringkasan Eksekutif

Proyek ini membangun model kecerdasan buatan yang dapat memprediksi pelanggan yang akan berhenti berlangganan sebelum terjadi, memungkinkan tindakan pencegahan dan peningkatan retensi pendapatan perusahaan.

📚 Sumber Data: IBM Telco Customer Churn Dataset (Kaggle) | Dataset: 7.043 pelanggan, 21 fitur, 99.99% kelengkapan | Periode: Snapshot historis | Lisensi: Open Use (Creative Commons)

🚀 Manfaat Utama

📊

307 Pelanggan Berisiko

Teridentifikasi dari 1.408 data uji untuk intervensi

💰

Rp 28+ Miliar

Potensi manfaat tahunan dari penerapan model

⏱️

3.2 Hari

Waktu untuk menutupi investasi model

👥

1.200+ Pelanggan

Dapat diselamatkan per tahun dengan intervensi

📈

Peningkatan 25-30%

Pertumbuhan tingkat retensi dengan strategi berbasis data

Siap Produksi

Sistem siap untuk diterapkan langsung ke lingkungan operasional

📊 Analitik Data & Visualisasi

5 grafik profesional yang menampilkan analisis mendalam tentang performa model, pola data, dan dampak bisnis

📊 Grafik 1: Perbandingan Model
Chart Description
perbandingan 3 model (Regresi Logistik, Hutan Acak, XGBoost) di sini. Grafik ini menunjukkan Regresi Logistik sebagai performa terbaik dengan akurasi 80.33% dan AUC 0.8434.
🎯 Grafik 2: Pentingnya Fitur
Chart Description
15 fitur teratas dengan skor kepentingan. Total Biaya dan Durasi Pelanggan adalah 2 faktor utama yang mempengaruhi churn.
🎯 Grafik 3: Matriks Kebingungan
Chart Description
Confusion Matrix untuk Logistic Regression model (Best Model). Hijau: Correct predictions (1,131 customers = 80.33% accuracy). Merah/Kuning: Wrong predictions (277 customers = 19.67% error). Insight: Model correctly identify 205 dari 380 actual churners (53.95% detection rate dari total churners).
📈 Grafik 4: Metrik Evaluasi
Chart Description
Penempatan Gambar: 4 sub-grafik menunjukkan perbandingan metrik antara 3 model. Regresi Logistik unggul di Presisi (84%) dan Skor F1 (87%).
📉 Grafik 5: Kurva ROC
Chart Description
Penempatan Gambar: 3 kurva ROC (RL=0.8434, HA=0.8252, XGB=0.8321) yang menunjukkan kemampuan model untuk membedakan pelanggan yang akan churn dengan yang tidak akan churn.

💡 Temuan Penting

Penemuan kunci dari analisis data yang mendalam

🔴
Segmen Berisiko Tinggi
Pelanggan baru (0-6 bulan) mewakili 21% dari basis pelanggan tetapi memiliki risiko churn tertinggi. Prioritaskan retensi di fase awal.
💰
Pendorong Nilai Pelanggan
Total biaya adalah prediktor terpenting (3.58% kepentingan). Fokus pada pelanggan dengan nilai seumur hidup rendah.
🎯
Durasi Pelanggan Penting
Durasi pelanggan peringkat #2 (3.12% kepentingan). Retensi pelanggan di bulan pertama sangat kritis untuk loyalitas jangka panjang.
🔗
Paket Layanan Bundel
Pelanggan dengan 5-7 layanan (44.53%) lebih loyal dibanding 0-2 layanan (25.59%). Strategi penjualan silang sangat efektif.
📊
Tingkat Churn Realistis
Tingkat churn 26.54% di dataset sesuai dengan standar industri (20-30%). Model dilatih pada data yang realistis.
Prediksi Cepat
Regresi Logistik memberikan prediksi dalam milidetik, ideal untuk sistem intervensi waktu nyata.

💎 Dampak Keuangan & ROI

Analisis mendalam tentang nilai bisnis dan tingkat pengembalian investasi

📈 Proyeksi Keuangan Tahunan

Rp 28B
Manfaat Tahunan
186,567%
ROI
3.2
Balik Modal (Hari)
1.200+
Pelanggan Diselamatkan
Rp 15M
Investasi Model
Rp 1.87M
Biaya per Pelanggan

📊 Rincian Perhitungan

Calon Churn/Tahun: ~5.000 pelanggan
Prediksi Model: 4.000 berisiko (akurasi 80%)
Kesuksesan Kampanye: Tingkat pencegahan 30%
Pelanggan Diselamatkan: 1.200 per tahun
Pendapatan Diselamatkan: Rp 30 Miliar (1.200 × Rp 25M nilai seumur hidup)
Biaya Kampanye: Rp 2 Miliar (4.000 × Rp 500K)

🚀 Rencana Implementasi

Strategi penerapan dan perluasan untuk memaksimalkan nilai bisnis

⏱️ BULAN 1-2

Fondasi: Penerapan model, pelatihan staf, penyiapan dasbor, kampanye uji coba (50 pelanggan)

📈 BULAN 3-6

Perluasan: Peluncuran penuh (500+ pelanggan), pengujian A/B, pemantauan performa, optimisasi

🎯 BULAN 6-12

Lanjutan: Pelatihan ulang triwulanan, analisis akar masalah, otomasi pemasaran, ekspansi ke segmen lain

⚙️ Spesifikasi Teknis

Informasi teknis tentang model, data, dan infrastruktur

📊 Basis Data

  • ✓ 7.043 total pelanggan
  • ✓ 21 fitur/variabel
  • ✓ Tingkat churn 26.54%
  • ✓ Kelengkapan data 99.99%

🧠 Model

  • ✓ Algoritma: Regresi Logistik
  • ✓ Tipe: Klasifikasi Biner
  • ✓ Pembagian Latih/Uji: 80/20
  • ✓ Status: Siap Produksi

⚡ Performa

  • ✓ Waktu prediksi: milidetik
  • ✓ Akurasi: 80.33%
  • ✓ Skor AUC: 0.8434
  • ✓ Memori: minimal